Transformersと論文”Attention Is All You Need”の差分が上手に説明されているね! ちなみにGPT(Generative Pre-trained Transformer)のTの話であり、StableDiffusionでも言語のトークン化に使われています。 30分で完全理解するTransformerの世界|株式会社ZENKIGEN https://t.co/mZVUEFlvEG #zenn 2023-02-15 aki <<>> February 15, 2023 at 09:20AM @o_ob